查看原文
其他

Nature: DNA提取vs数据分析,谁对结果影响大?

2017-11-04 微微悦明 宏基因组

本文转载自“微微悦明”,己获授权。


上周与大家分享了Nature Biotchnology的好文 《DNA提取也能发Nature?

本以为只是偶发的宏基因组方法评估类的高分文章,谁知道拔起萝卜连着泥,其竟然还有一篇姐妹篇,依旧是发表在Nature Biotechnology,依旧是方法评估!

综合看下来,其设计更复杂,涉及的实验环节更多,与生物信息更息息相关,更加值得我们关注。


Sinha R, Abuali G, Vogtmann E, et al. Assessment of variation in microbial community amplicon sequencing by the Microbiome Quality Control (MBQC) project consortium.[J]. Nature Biotechnology, 2017.


研究目标:评估16S扩增子宏基因组测序过程中不同阶段(DNA提取、样本保存、测序和数据分析)对结果的影响


样本数:23个。(注:虽然比上篇的2个样本数略多了一点,但比起现在动辄上百上千的样本数研究还是少很多,可见实验贵在精,即使少样本数依旧可以发高分文章)

23份样本,包括11份新鲜的粪便样本,7份冻干的粪便样本,2份Chemostat培养后样本,2份模拟样本,和1份阴性对照样本。


方法:所有样本经分装至96孔板后被分送至15家实验室分别进行DNA提取、16S建库和高通量测序。所得测序结果被分送至9家实验室分别进行生物信息分析。

关键字:15家实验室+9家数据分析 又是一个多单位大动作的联合实验对照



实验所涉及的对照:

(1)样本类型:粪便 vs 口腔;新鲜样本 vs 冻干样本;真实样本 vs 模拟样本

(2)DNA提取:中心实验室集中提取 vs 15家实验室分别提取;各实验室采用不同的DNA提取protocal(Mobio vs Promega vs Qiagen等)

(3)建库方法:16S扩增引物 (V3-V4 vs only V4)

(4)测序方法:Hiseq vs Miseq;单端测序 vs 双端测序;测序长度150bp~300bp

(5) 生物信息方法:QIIME vs UPARSE vs 很多。。。。

下表为文中涉及的各方法。左列为方法类别和方法名,右列为采用该方法的实验室数量。

注:本文涉及的对照方法太多,最终测序的样本数高达15,749个,其中真实样本1,991个,模拟样本(Artifical 样本)2033个,以及1725个chemostat samples。每个样本的测序read数在3万5至4万左右。

这篇牛文的内容过于丰富,结果太多,仅附图就有15个,附表9个,附文9个。在本文中,小编仅取部分精华与大家分享,更多细节请参照原文~


一句话结论: 不同实验阶段(样本提取、建库、数据分析)对最终结果皆有一定影响,其中DNA提取影响最大。


1、DNA提取方法影响16S宏基因组结果

该文的结果与其姐妹篇一致,皆证实了DNA提取方法对结果的显著影响,如下图所示,使用不同DNA提取方法,样本中各菌属的丰度会发生明显变化。

下图中横坐标代表不同的DNA提取方法,


本文还罗列了近年的相关文章,进一步证实该结果的可靠性。如下表所示,+表示该因素对结果有显著影响。


2、DNA提取方法对结果的影响高于生物信息学方法

在该实验中,作者设计了两个阶段的双盲检测,阶段1(实验)+阶段2(生物信息分析),文中评估不同因素对结果的影响,结果显示DNA提取方法影响实验结果,且其影响程度高于生物信息学方法。

如下图所示,不同颜色代表不同类型的样本(Human\Chemostat\Artifical\Blank),纵坐标越高代表影响较大。由图可知,不同提取方法的影响高于不同数据分析方法的影响。不同方法对真实样本的影响高于对模拟样本的影响。




3、不同类型样本受方法影响不同

相比较于真实样本,模拟样本受不同方法的影响较少。

如图所示,左图为真实样本,右图为模拟样本。横坐标为不同实验室。图中可见真实样本不同实验室的处理结果有明显差别。


4、实验室中存在样本污染的情况

以HL-A实验室为例,其所处理的所有样本中Lactobacillus与其他实验室相比都有升高。另有三家实验室有明显的Pseudomonas升高。

实验采用Tris-HCL buffer做为阴性对照样本,在不同实验室中检测出不同的污染菌。


微微碎碎念:作为一只生物信息狗,小编为啥一直一直关注测序实验的文章呢?

这篇文章帮我做出了最好的回答~

测序实验作为数据的来源,其中有太多的影响因素(坑)存在了。实验过程(Protocal)的所导致的对结果的变化远大于生物信息方法。

因此,在我们这些生物信息狗选择程序、纠结参数、优化结果之前,实验阶段的严格把关、标准化处理,才是我们应该最先关注的!

你以为你找到了Marker菌,也许只是实验污染。

你以为两组样本间有显著差异,也许只是采用了不同的protocal。

为避免这样的惨剧发生,小编再次呼吁

测序实验标准化很重要!

微信号:

Mypathogen

微微悦明

科学的乐趣是获得新知识的喜悦

高通量测序、大数据

病原微生物检测和监测

健康大数据行业资讯记录与分享

猜你喜欢

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外六十位多PI,六百多名一线科研人员加入。参与讨论,获得专业指导、问题解答,欢迎分享此文至朋友圈,并扫码加创始人好友带你入群,务必备注“姓名-单位-研究方向-职务”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决推荐生信技能树-微生物组版块(http://www.biotrainee.com/forum-88-1.html) 发贴,并转发链接入群,问题及解答方便检索,造福后人。


学习16S扩增子、宏基因组科研思路和分析技术,快关注“宏基因组”

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存